FILTER MODE ACTIVE

#оценка моделей

Найдено записей: 5

#оценка моделей26.10.2025

Обучение и сравнение RL-агентов для трейдинга с Stable-Baselines3: практическое руководство

'Создайте кастомную торговую среду и обучите несколько RL-агентов с Stable-Baselines3, затем оцените и визуализируйте их поведение, чтобы выбрать лучшую стратегию.'

ЧИТАТЬ →

#оценка моделей01.07.2025

TabArena: революция в бенчмаркинге табличного машинного обучения с масштабируемой воспроизводимостью и ансамблированием

TabArena — динамичная и постоянно обновляемая платформа для бенчмаркинга табличного машинного обучения с упором на воспроизводимость, ансамблирование и глубокую настройку моделей.

ЧИТАТЬ →

#оценка моделей11.06.2025

Прорыв Meta: новая методика измеряет, сколько языковые модели запоминают на уровне бит

Meta и партнёры разработали новую методику для точного измерения запоминания языковых моделей, показав, что GPT хранит около 3,6 бит на параметр, и предоставили важные инсайты о различии между запоминанием и обобщением.

ЧИТАТЬ →

#оценка моделей23.05.2025

MMLONGBENCH: Новый стандарт оценки долгоконтекстных моделей с визуально-языковым пониманием

Исследователи представили MMLONGBENCH — первый комплексный бенчмарк для оценки долгоконтекстных визуально-языковых моделей, выявляющий ключевые особенности и проблемы в их работе.

ЧИТАТЬ →

#оценка моделей16.05.2025

ИИ-модели запоминают тестовые данные, искажающие их результаты

Новое исследование показывает, что большие языковые модели часто запоминают тестовые наборы данных, такие как MovieLens-1M, что искажает их результаты и качество рекомендаций.

ЧИТАТЬ →